智能论文笔记

Where's the Learning in Representation Learning for Compositional Semantics and the Case of Thematic Fit

Mughilan Muthupari , Samrat Halder , Asad Sayeed , Yuval Marton

分类：自然语言处理

2022-08-09

观察到对于某些NLP任务，例如语义角色预测或主题拟合估计，随机嵌入性能以及预处理的嵌入方式，我们探索了哪些设置允许并检查大多数学习的编码：语义角色，语义角色，语义角色嵌入或``网络''。我们发现细微的答案，具体取决于任务及其与培训目标的关系。我们研究了多任务学习中的这些表示学习方面，在这些方面，角色预测和角色填充是受监督的任务，而几个主题拟合任务不在模型的直接监督之外。我们观察到某些任务的质量得分与培训数据规模之间的非单调关系。为了更好地理解此观察结果，我们使用这些任务的每个动力版本来分析这些结果。

translated by 谷歌翻译

A Sequence Agnostic Multimodal Preprocessing for Clogged Blood Vessel Detection in Alzheimer's Diagnosis

Partho Ghosh , Md. Abrar Istiak , Mir Sayeed Mohammad , Swapnil Saha , Uday Kamal

分类：计算机视觉

2022-11-06

Successful identification of blood vessel blockage is a crucial step for Alzheimer's disease diagnosis. These blocks can be identified from the spatial and time-depth variable Two-Photon Excitation Microscopy (TPEF) images of the brain blood vessels using machine learning methods. In this study, we propose several preprocessing schemes to improve the performance of these methods. Our method includes 3D-point cloud data extraction from image modality and their feature-space fusion to leverage complementary information inherent in different modalities. We also enforce the learned representation to be sequence-order invariant by utilizing bi-direction dataflow. Experimental results on The Clog Loss dataset show that our proposed method consistently outperforms the state-of-the-art preprocessing methods in stalled and non-stalled vessel classification.

translated by 谷歌翻译

Efficient Approximate Kernel Based Spike Sequence Classification

Sarwan Ali , Bikram Sahoo , Muhammad Asad Khan , Alexander Zelikovsky , Imdad Ullah Khan , Murray Patterson

分类：机器学习

2022-09-11

机器学习（ML）模型，例如SVM，用于分类和序列的聚类等任务，需要定义序列对之间的距离/相似性。已经提出了几种方法来计算序列之间的相似性，例如确切的方法计算$ k $ -s-mers（长度$ k $的子序列）之间的匹配数和估计成对相似性得分的近似方法。尽管精确的方法产生了更好的分类性能，但它们的计算成本很高，将其适用性限制在少量序列中。事实证明，近似算法更可扩展，并具有相当的性能（有时更好）确切方法 - 它们以“一般”方式设计用于处理不同类型的序列（例如音乐，蛋白质等）。尽管一般适用性是算法的所需属性，但在所有情况下都不是这种情况。例如，在当前的Covid-19（冠状病毒）大流行中，需要一种可以专门处理冠状病毒的方法。为此，我们提出了一系列方法来提高近似内核的性能（使用最小化和信息增益），以增强其预测性能PM冠状病毒序列。更具体地说，我们使用域知识（使用信息增益计算）和有效的预处理（使用最小值计算）来提高近似内核的质量，以对与不同变体相对应的冠状病毒峰值蛋白序列进行分类（例如，Alpha，Beta，Beta，Gamma）。我们使用不同的分类和聚类算法报告结果，并使用多个评估指标评估其性能。使用两个数据集，我们表明我们提出的方法有助于与医疗保健领域的基线和最先进的方法相比，有助于提高内核的性能。

translated by 谷歌翻译

GRASP-Net: Geometric Residual Analysis and Synthesis for Point Cloud Compression

Jiahao Pang , Muhammad Asad Lodhi , Dong Tian

分类：计算机视觉

2022-09-09

点云压缩（PCC）是各种3-D应用程序的关键推动器，这是由于点云格式的通用性。理想情况下，3D点云努力描绘了连续的对象/场景表面。实际上，作为一组离散样本，点云是局部断开连接并稀疏分布的。这种稀疏的性质阻碍了在压缩点之间发现局部相关性的发现。通过分形维度的分析，我们提出了一种异质方法，并深入学习有损耗的点云几何压缩。在压缩输入的粗表示的基础层的顶部上，增强层的设计旨在应对具有挑战性的几何残差/详细信息。具体而言，应用基于点的网络将不稳定的本地详细信息转换为位于粗点云上的潜在特征。然后启动了在粗点云上运行的稀疏卷积神经网络。它利用粗糙几何形状的连续性/平滑度来压缩潜在特征，作为增强的位流，极大地使重建质量受益。当此位流不可用时，例如，由于数据包丢失，我们支持具有相同体系结构的跳过模式，该模式直接从粗点云中生成几何细节。对密度和稀疏点云的实验证明了我们的提案实现的最新压缩性能。我们的代码可在https://github.com/interdigitalinc/grasp-net上找到。

translated by 谷歌翻译

Compound Figure Separation of Biomedical Images: Mining Large Datasets for Self-supervised Learning

Tianyuan Yao , Chang Qu , Jun Long , Quan Liu , Ruining Deng , Yuanhan Tian , Jiachen Xu , Aadarsh Jha , Zuhayr Asad , Shunxing Bao

分类：计算机视觉

2022-08-30

随着自我监督学习的快速发展（例如，对比度学习），在医学图像分析中广泛认识到具有大规模图像（即使没有注释）来训练更具概括的AI模型的重要性。但是，大规模收集大规模任务的未注释数据对于单个实验室来说可能具有挑战性。现有的在线资源（例如数字书籍，出版物和搜索引擎）为获取大型图像提供了新的资源。然而，在医疗保健中发布的图像（例如放射学和病理学）由大量的带有子图的复合图组成。为了提取和分离化合物形象为下游学习的可用单个图像，我们提出了一个简单的复合图分离（SIMCFS）框架，而无需使用传统所需的检测边界框注释，并具有新的损失函数和硬案例模拟。我们的技术贡献是四倍：（1）我们引入了一个基于模拟的培训框架，该框架最小化了对资源广泛的边界框注释的需求；（2）我们提出了一种新的侧损失，可针对复合人物分离进行优化；（3）我们提出了一种阶层内图像增强方法来模拟硬病例；（4）据我们所知，这是第一项评估利用复合图像分离的自我监督学习功效的研究。从结果来看，提出的SIMCF在ImageClef 2016复合人物分离数据库上实现了最先进的性能。使用大规模开采数字的预审预革的学习模型通过对比度学习算法提高了下游图像分类任务的准确性。 SIMCF的源代码可在https://github.com/hrlblab/imageseperation上公开获得。

translated by 谷歌翻译

HTML版本

A Vision Transformer-Based Approach to Bearing Fault Classification via Vibration Signals

Abid Hasan Zim , Aeyan Ashraf , Aquib Iqbal , Asad Malik , Minoru Kuribayashi

分类：计算机视觉

2022-08-15

滚动轴承是旋转机械的最关键组成部分。及时识别有缺陷的轴承可能会阻止整个机械系统的故障。由于机器零件的快速发展，机械状况监测场已进入大数据阶段。当使用大量数据时，手动特征提取方法的缺点是效率低下和不准确。近年来，诸如深度学习方法之类的数据驱动方法已成功用于机械智能故障检测。卷积神经网络（CNN）主要用于早期研究中，以检测和识别轴承断层。但是，CNN模型遭受了难以管理故障时间信息的缺点，这导致缺乏分类结果。在这项研究中，使用最先进的视觉变压器（VIT）对轴承缺陷进行了分类。使用Case Western Reserve University（CWRU）实验室实验数据对轴承缺陷进行了分类。该研究还考虑了除正常轴承条件外，在0负载情况下的13种不同类型的缺陷。使用短时傅立叶变换（STFT），将振动信号转换为2D时频图像。 2D时频图像用作VIT的输入参数。该模型的总体准确度为98.8％。

translated by 谷歌翻译

Boundary Distance Loss for Intra-/Extra-meatal Segmentation of Vestibular Schwannoma

Navodini Wijethilake , Aaron Kujawa , Reuben Dorent , Muhammad Asad , Anna Oviedova , Tom Vercauteren , Jonathan Shapey

分类：计算机视觉 | 机器学习

2022-08-09

前庭造型瘤（VS）通常从内耳生长到大脑。它可以分为两个区域，分别对应于内耳管内或外部。外部区域的生长是决定疾病管理的关键因素，其次是临床医生。在这项工作中，提出了将细分分为内部/优质零件的VS分割方法。我们注释了一个由227个T2 MRI实例组成的数据集，对137名患者进行了纵向获得，不包括术后实例。我们提出了一种分阶段的方法，第一阶段进行整个肿瘤分割，第二阶段使用T2 MRI以及从第一阶段获得的掩码进行了术中/极度分割。为了提高预测的肉类边界的准确性，我们引入了特定于任务的损失，我们称之为边界距离损失。与直接仪内分割任务性能（即基线）相比，评估了该性能。我们所提出的方法采用两阶段方法和边界距离损失，分别达到0.8279+-0.2050和0.7744+-0.1352，分别为室外和室内室内区域，显着提高了基线，这给出了0.7939+的骰子得分-0.2325和0.7475+-0.1346分别用于室外和室内区域。

translated by 谷歌翻译

Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A Frequentest and Machine Learning based Stacking Framework

Numan Ahmad , Behram Wali , Asad J. Khattak

分类：机器学习

2022-07-21

多种统计和机器学习方法用于使用机器学习方法在特定道路上建模崩溃频率，通常具有更高的预测准确性。最近，包括堆叠在内的异质集合方法（HEM）已成为更准确和强大的智能技术，并且通常通过提供更可靠和准确的预测来解决模式识别问题。在这项研究中，我们将堆叠的关键下摆方法之一应用于城市和郊区动脉的五个车道段（5T）上的崩溃频率。将堆叠的预测性能与参数统计模型（泊松和负二项式）和三种最先进的机器学习技术（决策树，随机森林和梯度增强）进行了比较，每种技术都被称为基础学习者。通过采用最佳的体重方案通过堆叠结合单个基础学习者，由于规格和预测准确性的差异，各个基础学习者中有偏见的预测问题可以避免。从2013年到2017年收集并集成了包括崩溃，流量和道路清单在内的数据。数据分为培训，验证和测试数据集。统计模型的估计结果表明，除其他因素外，崩溃随着不同类型的车道的密度（每英里数）的增加而增加。各种模型的样本外预测的比较证实了堆叠优于所考虑的替代方法的优越性。从实际的角度来看，堆叠可以提高预测准确性（与仅使用具有特定规范的基本学习者相比）。当系统地应用时，堆叠可以帮助确定更合适的对策。

translated by 谷歌翻译

Omni-Seg+: A Scale-aware Dynamic Network for Pathological Image Segmentation

Ruining Deng , Quan Liu , Can Cui , Tianyuan Yao , Jun Long , Zuhayr Asad , R. Michael Womick , Zheyu Zhu , Agnes B. Fogo , Shilin Zhao

分类：计算机视觉

2022-06-27

由于物体的异质尺度，肾脏病理图像的全面语义分割具有挑战性。例如，在整个幻灯片图像（WSI）上，肾小球的横截面区域的距离可能比周围毛细管的64倍，这使得以相同尺度上的同一贴片对两个对象进行分割是不切实际的。为了解决这个缩放问题，先前的研究通常已经训练了多个分割网络，以匹配异质组织类型的最佳像素分辨率。这种多网络解决方案是资源密集型的，无法对组织类型之间的空间关系进行建模。在本文中，我们提出了Omni-Seg+网络，这是一种通过单个神经网络实现多对象（六种组织类型）和多尺度（5倍至40倍尺度）的多尺度（5倍至40倍尺度）的动态神经网络。本文的贡献是三个方面的：（1）提出了一种新型的量表感知控制器，以将动态神经网络从单尺度到多尺度推广；（2）引入了伪标签的半监督一致性正规化，以建模未经注释的组织类型的尺度相关性成单个端到端的学习范式；（3）直接将在人类肾脏图像训练的模型中直接应用于小鼠肾脏图像，而无需再培训，就可以证明高尺度感知的概括。通过从三种不同分辨率下从六种组织类型中学习的约150,000个人类病理图像斑块，我们的方法根据人类的视觉评估和图像词的评估（即空间转录组学）获得了卓越的分割性能。官方实施可在https://github.com/ddrrnn123/omni-seg上获得。

translated by 谷歌翻译

Traffic Congestion Prediction Using Machine Learning Techniques

Moumita Asad , Rafed Muhammad Yasir , Dr. Naushin Nower , Dr. Mohammad Shoyaib

分类：机器学习

2022-06-22

交通拥堵的预测在做出未来的决策中起着至关重要的作用。尽管已经进行了许多有关拥塞的研究，但其中大多数不能涵盖所有重要因素（例如天气条件）。我们提出了一个交通拥堵的预测模型，该模型可以根据日，时间和几个天气数据（例如温度，湿度）预测拥堵。为了评估我们的模型，已针对新德里的流量数据进行了测试。通过这种模型，可以预测一周的道路拥堵，平均RMSE为1.12。因此，该模型可用于事先采取预防措施。

translated by 谷歌翻译